Regular Expression এর মৌলিক ধারণা

Computer Programming - অক (Awk) Regular Expressions এবং AWK (Regular Expressions in AWK) |
210
210

Regular Expression এর মৌলিক ধারণা

Regular Expression (রেগুলার এক্সপ্রেশন), সংক্ষেপে RegEx বা regexp, একটি প্যাটার্ন বা নিদর্শন, যা সাধারণত টেক্সট ডেটায় নির্দিষ্ট ধরণের তথ্য খুঁজে বের করতে ব্যবহৃত হয়। এটি একটি শক্তিশালী টুল যা বিভিন্ন প্রোগ্রামিং ভাষায় পাওয়া যায় এবং ডেটা ফিল্টারিং, প্রক্রিয়াকরণ, এবং বিশ্লেষণে ব্যবহৃত হয়।


Regular Expression এর মৌলিক বৈশিষ্ট্য

  1. প্যাটার্ন ভিত্তিক অনুসন্ধান: RegEx ব্যবহার করে আপনি নির্দিষ্ট প্যাটার্ন অনুযায়ী টেক্সট ডেটায় অনুসন্ধান করতে পারেন।
  2. টেক্সট ম্যানিপুলেশন: এটি ব্যবহার করে আপনি টেক্সট থেকে নির্দিষ্ট অংশ বের করা, পরিবর্তন করা, বা তথ্য খুঁজে বের করা সম্ভব।
  3. প্রোগ্রামিং ভাষার সমর্থন: RegEx সাধারণত প্রায় সকল আধুনিক প্রোগ্রামিং ভাষায় সমর্থিত, যেমন Python, JavaScript, Java, Perl, এবং AWK।

Regular Expression এর মৌলিক উপাদান

  • সাধারণ চরিত্র (Literal Characters): যেমন a, b, 1, 2 ইত্যাদি। এগুলি সরাসরি মেলে।
  • বিশেষ চিহ্ন (Metacharacters): যেমন ., *, +, ?, ^, $, [ ], ( ), { }, | ইত্যাদি। এগুলি নির্দিষ্ট প্যাটার্ন অনুসারে মেলানোর জন্য ব্যবহার করা হয়।

গুরুত্বপূর্ণ Metacharacters এবং তাদের অর্থ

  1. . (ডট): যে কোনো একক অক্ষর নির্দেশ করে।
    • প্যাটার্ন h.t "hat", "hot", "hit" এর সাথে মিলে যায়।
  2. ^ (ক্যারেট): কোনো লাইনের শুরু নির্দেশ করে।
    • প্যাটার্ন ^Hello শুধুমাত্র সেই লাইনের সাথে মিলে যাবে যা "Hello" দিয়ে শুরু হয়।
  3. $ (ডলার): কোনো লাইনের শেষ নির্দেশ করে।
    • প্যাটার্ন end$ শুধুমাত্র সেই লাইনের সাথে মিলে যাবে যা "end" দিয়ে শেষ হয়।
  4. * (স্টার): শূন্য বা একাধিকবার পূর্ববর্তী চরিত্র বা গ্রুপের পুনরাবৃত্তি নির্দেশ করে।
    • প্যাটার্ন ab* "a", "ab", "abb" ইত্যাদির সাথে মিলে যাবে।
  5. + (প্লাস): অন্তত একবার পূর্ববর্তী চরিত্র বা গ্রুপের পুনরাবৃত্তি নির্দেশ করে।
    • প্যাটার্ন ab+ "ab", "abb", "abbb" ইত্যাদির সাথে মিলে যাবে, কিন্তু "a" এর সাথে নয়।
  6. ? (কোশ্চেন): পূর্ববর্তী চরিত্র বা গ্রুপ শূন্য বা একবার মেলে।
    • প্যাটার্ন colou?r "color" এবং "colour" উভয়ের সাথে মিলে যাবে।
  7. [ ] (সেট): সেটের মধ্যে থাকা যে কোনো একক চরিত্র মেলে।
    • প্যাটার্ন [aeiou] যেকোনো vowel এর সাথে মিলে যাবে।
  8. | (অর): বিকল্প নির্দেশ করে।
    • প্যাটার্ন cat|dog "cat" অথবা "dog" এর সাথে মিলে যাবে।

RegEx এর ব্যবহার উদাহরণ

  1. সাধারণ প্যাটার্ন ম্যাচিং:

    awk '/^Error/' logfile.txt

    এই AWK কমান্ডটি logfile.txt ফাইলের শুধুমাত্র সেই লাইনগুলো প্রিন্ট করবে যা "Error" দিয়ে শুরু হয়েছে।

  2. নির্দিষ্ট ফিল্ডে প্যাটার্ন অনুসন্ধান:

     

    এই AWK কমান্ডটি data.txt ফাইলের দ্বিতীয় ফিল্ডে বড় হাতের অক্ষর দিয়ে শুরু হওয়া লাইনের পুরো লাইন প্রিন্ট করবে।


সাধারণ RegEx উদাহরণ

  • [0-9]: যেকোনো সংখ্যা (0 থেকে 9)।
  • [a-z]: ছোট হাতের যেকোনো অক্ষর (a থেকে z)।
  • [A-Z]: বড় হাতের যেকোনো অক্ষর (A থেকে Z)।
  • \d: যেকোনো সংখ্যা (0-9), যা কিছু ভাষায় \d দ্বারা নির্দেশ করা হয়।
  • \w: যেকোনো অক্ষর বা সংখ্যা।
  • \s: যেকোনো স্পেস চিহ্ন।

সারসংক্ষেপ

Regular Expression (RegEx) হল একটি শক্তিশালী টুল যা টেক্সট প্রক্রিয়াকরণ, তথ্য অনুসন্ধান এবং বিশ্লেষণে ব্যবহৃত হয়। এটি বিশেষ চরিত্র এবং প্যাটার্ন ব্যবহার করে ডেটার মধ্যে নির্দিষ্ট অংশ অনুসন্ধান ও পরিবর্তন করতে সাহায্য করে। RegEx এর সাহায্যে প্রোগ্রামাররা সহজেই বড় ডেটাসেট প্রক্রিয়া এবং ফিল্টার করতে পারেন, যা প্রোগ্রামিং এবং ডেটা ম্যানিপুলেশনের ক্ষেত্রে অত্যন্ত কার্যকর।

common.content_added_by
টপ রেটেড অ্যাপ

স্যাট অ্যাকাডেমী অ্যাপ

আমাদের অল-ইন-ওয়ান মোবাইল অ্যাপের মাধ্যমে সীমাহীন শেখার সুযোগ উপভোগ করুন।

ভিডিও
লাইভ ক্লাস
এক্সাম
ডাউনলোড করুন
Promotion